Etat de l'art : Extraction de connaissances à partir de thesaurus pour générer une ontologie

نویسندگان

  • Fabien Amarger
  • Catherine Roussey
  • Jean-Pierre Chanet
  • Ollivier Haemmerlé
  • Nathalie Hernandez
چکیده

In order to participate to the Linked Data for agriculture, we want to use AGROVOC that is a multilingual thesaurus maintained by FAO with more than 40,000 terms. We present here a state of the art about techniques proposed to transform a domain ontology from thesaurus. For this we will study ten methodologies along three axes: the extraction of classes, the extraction of the hierarchy and other relation extraction. We were able to identify some complex aspects from methodologies such as the complexity of disambiguation or validation that led a return to manual techniques. MOTS-CLÉS : ontologie, extraction d’informations, enrichissement, thesaurus

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Génération de contraintes pour le clustering à partir d'une ontologie - Application à la classification d'images satellites

Résumé. L’utilisation des connaissances a priori peut fortement améliorer la classification non-supervisée. L’injection de ces connaissances sous forme de contraintes sur les données figure parmi les techniques les plus efficaces de la littérature. Cependant, la génération des contraintes est très coûteuse et demande l’intervention de l’expert ; la sémantique apportée par l’étiquetage de l’expe...

متن کامل

Gestion de l'incertitude dans le cadre d'une extraction des connaissances à partir de texte

Résumé. Le domaine de l’extraction de connaissances à partir de texte nécessite des méthodes permettant de détecter et de manipuler l’incertitude. En effet, de nombreux textes contiennent des informations dont la véracité peut être remise en cause. Il convient alors de gérer de manière efficace ces informations afin de représenter les connaissances de manière explicite. Une première démarche co...

متن کامل

Reconnaissance automatique de concepts à partir d'une ontologie

Résumé Ce papier présente une approche qui s’appuie sur une ontologie pour reconnaître automatiquement des concepts spécifiques à un domaine dans un corpus en langue naturelle. La solution proposée est non-supervisée et peut s’appliquer à tout domaine pour lequel une ontologie a été déjà construite. Un corpus du domaine est utilisé dans lequel les concepts seront reconnus. Dans une première pha...

متن کامل

Conception assistée d'une ontologie à partir d'une conceptualisation consensuelle exprimée de manière semi-formelle

Résumé : Cet article présente une méthodologie assistée de conception d'une ontologie à travers trois méthodes, soit une méthode d'élicitation des connaissances d'un domaine résultant en un modèle semi-formel de ces connaissances, une méthode de formalisation conduisant à la production d’une ontologie et une méthode de validation syntaxique et sémantique de l'ontologie. Les processus de formali...

متن کامل

Utilisation du Web Sémantique pour la gestion d'une liste de diffusion d'une CoP

L’extraction d’informations à partir de messages électroniques (mails) n’a pas été très étudiée dans la communauté du TAL1. Ceci est dû principalement à la présentation informelle des mails et à leurs faibles apports d’informations. Cependant, les mails peuvent être parfois la principale source de connaissances pour une organisation ou une communauté de pratique (CoP). C’est le cas d’@pretic2 q...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2013